گسترش پرس و جو در موتور جستجوی فارسی

پایان نامه
چکیده

پرس وجو برای بیان نیازهای کاربران به اطلاعات موجود در صفحات وب و سایر منابع، مطرح می شود. پرس وجوهای کاربران معمولاً «بسیار کوتاه» و شامل دو یا سه کلمه می باشند. قابلیت زبان های مختلف در بیان یک مفهوم با چندین کلمه مترادف و وجود یک کلمه با بیش از یک معنی، منجر به مشکل «عدم تطابق کلمه» و «مبهم بودن پرس وجو» می شوند. در نتیجه تعداد زیادی اسناد غیرمرتبط بازیابی شده و دقت کاهش می یابد. برای رفع این مشکلات از تکنیک گسترش پرس وجو استفاده می شود که از طریق پیشنهاد و افزودن واژگان مناسب به پرس وجوی کاربر، موجب بهبود دقت بازیابی خواهد شد. مهمترین مسئله، تشخیص و انتخاب واژه خوب برای افزودن به پرس وجوی کاربر می باشد. در مباحث گسترش پرس وجو دو عامل مهم «روش انتخاب واژگان گسترش» و «منابع واژگان گسترش» وجود دارد. در این پایان نامه با درنظر گرفتن ویژگی های زبان فارسی و مسائل مرتبط با آن، به بررسی گسترش پرس وجو در موتور جستجوی فارسی می پردازیم. برای این کار از هستان شناسی عمومی فارس نت و شبکه مفهوم استفاده می کنیم که در برگیرنده روابط میان مفاهیم و کلمات می باشد. پس از دریافت پرس وجوی کاربر از طریق مطابقت آن با شبکه مفهوم، گروهی از کلمات مرتبط با پرس وجوی کاربر استخراج می شوند و در مرحله بعد مطابق الگوریتم ارائه شده، رتبه بندی می شوند. در پایان تعدادی از کلمات بسیار مرتبط با پرس وجوی کاربر به صورت خودکار به پرس وجوی اولیه کاربر افزوده می شوند و پرس وجوی گسترش یافته مورد جستجو قرار می گیرد. نتایج آزمایش های انجام شده، نشان دهنده بهبود عملکرد و افزایش دقت بازیابی می باشد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

گسترش معنایی پرس و جو

بازیابی اطلاعات یکی از اصلی ترین نیازهای کاربران است؛ روزانه کاربران زیادی به جستجو در وب و دیگر منابع به منظور پاسخ گویی به نیاز اطلاعاتی خود می پردازند. مسائل موجود در زبان طبیعی از جمله عدم تطابق لغوی، کلمات چند معنایی، کوتاه و مبهم بودن پرس وجو و دانش ناقص کاربران از موضوع مورد نظر در بازیابی اطلاعات منجر به بازیابی نتایج نامرتبط و کاهش رضایت کاربران از نتایج بازیابی شده می شود. گسترش پرس و...

15 صفحه اول

ارزیابی همپوشانی و پوشش چهار موتور جستجوی بومی اصلی: پارسی جو، یوز، پارسیک و ریسمون

هدف: پژوهش حاضر با هدف  سنجش همپوشانی موتورهای جستجوی بومی پارسی جو، یوز، پارسیک، و ریسمون و مقایسه توانمندی‌های  این موتورها در  پوشش دادن وب نمایه‌پذیر انجام گرفت. روش: پژوهش از نوع کاربردی ارزیابانه بود. برای گردآوری اطلاعات از روش مبتنی بر کلیدواژه بهره گرفته شد، بدین ترتیب ابتدا کلیدواژه‌های انتخاب شده به موتورهای جستجو ارائه و از رکوردهای بازیابی شده نمونه‌گیری و با توجه به وجود یا نبود ا...

متن کامل

الگوهای تعامل و راهبردهای بازآرایی پرس‌و‌جو توسط کاربران در یک موتور جستجوی فارسی

فرایند جستجو در وب با زندگیِ برخط امروزی عجین شده است. موتورهای جستجو، با دریافت پرس‌وجوهای کاربران، تعداد محدودی از اسناد مرتبط را از میان چندین میلیارد صفحۀ وب بازیابی می‌کنند. بنابراین موتورهای جستجو با ثبت مجموعۀ پرس‌وجوهای کاربران در درازمدت می‌توانند به مجموعه‌ای از اطلاعات دربارۀ الگوهای رفتاری کاربران دست یابند. این الگوها می‌توانند در فرایندهایی مانند گسترش پرس‌وجو، پیشنهاد پرس‌وجو و تص...

متن کامل

کشف الگوی کلیک کاربران برای استفاده در پرس و جو

مقدمه: در طراحی موتورهای جستجو، بررسی پایگاه داده ی مورد مطالعه و ایجاد ارتباط با آن حائز اهمیت است. روش تحقیق: پژوهش حاضر از نوع کاربردی است که با استفاده از روش مشاهده اجرا می شود. آنچه که در پژوهش حاضر بکار رفته روش مطالعه موردی است. یافته ها: الگوی اغلب جستجوهای انجام شده، در بیشتر موارد به صورت کلی به جزئی و اختصاصی است. شرکت کنندگان جستجویشان را با اطلاعات کلی مانند معرفی و بر...

متن کامل

الگوریتم بازیابی و رتبه‌بندی اطلاعات در موتور جستجوی گوگل

هدف اساسی این مقاله، تبیین نحوه عمل موتور جستجوی گوگل در رتبه‌بندی اطلاعات بازیابی شده است و بدین منظور، الگوریتم (خوارزمی) موتور جستجوی گوگل را در بازیابی و رتبه‌بندی اطلاعات بررسی می‌کند. در بخش اول – که text matching نامیده می‌شود – شیوه یافتن اطلاعات مرتبط با واژه‌های واردشده در جعبه جستجو، به‌طور خلاصه بیان می‌گردد و در بخش دوم – که بخش اصلی مقاله است و PageRank نام دارد – شیوه رتبه‌بندی ن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه یزد

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023